智能论文笔记

DataPerf: Benchmarks for Data-Centric AI Development

Mark Mazumder , Colby Banbury , Xiaozhe Yao , Bojan Karlaš , William Gaviria Rojas , Sudnya Diamos , Greg Diamos , Lynn He , Douwe Kiela , David Jurado

分类：机器学习

2022-07-20

机器学习（ML）研究通常集中在模型上，而最突出的数据集已用于日常的ML任务，而不考虑这些数据集对基本问题的广度，困难和忠诚。忽略数据集的基本重要性已引起了重大问题，该问题涉及现实世界中的数据级联以及数据集驱动标准的模型质量饱和，并阻碍了研究的增长。为了解决此问题，我们提出Dataperf，这是用于评估ML数据集和数据集工作算法的基准软件包。我们打算启用“数据棘轮”，其中培训集将有助于评估相同问题的测试集，反之亦然。这种反馈驱动的策略将产生一个良性的循环，该循环将加速以数据为中心的AI。MLCommons协会将维护Dataperf。

translated by 谷歌翻译

Sustainable AI: Environmental Implications, Challenges and Opportunities

Carole-Jean Wu , Ramya Raghavendra , Udit Gupta , Bilge Acun , Newsha Ardalani , Kiwan Maeng , Gloria Chang , Fiona Aga Behram , James Huang , Charles Bai

分类：机器学习 | 人工智能

2021-10-30

本文探讨了超线性增长趋势的环境影响，从整体角度来看，跨越数据，算法和系统硬件。我们通过在行业规模机器学习用例中检查模型开发周期来表征AI计算的碳足迹，同时考虑系统硬件的生命周期。进一步迈出一步，我们捕获AI计算的操作和制造碳足迹，并为硬件 - 软件设计和尺度优化的结束分析以及如何帮助降低AI的整体碳足迹。根据行业经验和经验教训，我们分享关键挑战，并在AI的许多方面上绘制了重要的发展方向。我们希望本文提出的关键信息和见解能够激发社区以环保的方式推进AI领域。

translated by 谷歌翻译

Hyperbolic Centroid Calculations for Text Classification

Aydın Gerek , Cüneyt Ferahlar , Bilge Şipal Sert , Mehmet Can Yüney , Onur Taşdemir , Zeynep Billur Kalafat , Mert Kelkit , Murat Can Ganiz

分类：自然语言处理

2022-11-08

A new development in NLP is the construction of hyperbolic word embeddings. As opposed to their Euclidean counterparts, hyperbolic embeddings are represented not by vectors, but by points in hyperbolic space. This makes the most common basic scheme for constructing document representations, namely the averaging of word vectors, meaningless in the hyperbolic setting. We reinterpret the vector mean as the centroid of the points represented by the vectors, and investigate various hyperbolic centroid schemes and their effectiveness at text classification.

translated by 谷歌翻译

A Method For Automated Drone Viewpoints to Support Remote Robot Manipulation

Emmanuel Senft , Michael Hagenow , Pragathi Praveena , Robert Radwin , Michael Zinn , Michael Gleicher , Bilge Mutlu

分类：机器人

2022-08-08

无人机可以提供最小约束的适应摄像头视图，以支持机器人远程启用。此外，可以自动化无人机视图，以减轻远程运行期间操作员的负担。但是，现有方法并不关注使用无人机作为自动视图提供商的两个重要方面。首先是无人机应如何从工作空间内的一系列质量视点（例如对象的相对侧）中进行选择。第二是如何补偿不可避免的无人机姿势不确定性。在本文中，我们提供了一种非线性优化方法，该方法可通过铰接的操纵器产生有效和适应性的无人机观点，用于远程注射。我们的第一个关键想法是使用稀疏的人类输入输入来在多个自动生成的无人机观点之间切换。我们的第二个关键思想是引入优化目标，以在考虑无人机不确定性以及对观点遮挡和环境碰撞的影响的同时，保持对操纵器的视图。我们在无人机操纵器远程遥控系统中提供了无人机观点方法的实例化。最后，我们在完成普通家庭和工业操作的任务中对方法进行了初步验证。

translated by 谷歌翻译

LPYOLO: Low Precision YOLO for Face Detection on FPGA

Bestami Günay , Sefa Burak Okcu , Hasan Şakir Bilge

分类：计算机视觉 | 机器学习

2022-07-21

近年来，边缘计算设备和人工智能应用程序的数量过多。在边缘计算中，决策过程和计算从服务器转移到边缘设备。因此，需要便宜和低电源设备。 FPGA具有非常低的功率，倾向于进行平行操作和用于运行卷积神经网络（CNN）的非常合适的设备，这是人工智能应用程序的基本单位。监视系统上的面部检测是安全市场上最期待的应用。在这项工作中，重新设计了Tinyyolov3体系结构并部署了面部检测。它是一种基于CNN的对象检测方法，并为嵌入式系统开发。 Pynq-Z2被选为具有低端Xilinx Zynq 7020 System-On-Chip（SOC）的目标板。重新设计的TinyYolov3模型是用Brevitas库以许多位宽度精度定义的，Brevitas库将基本的CNN层和激活以整数量化形式。然后，使用宽面数据集对模型进行了量化结构的训练。为了减少延迟和功耗，FPGA的ONCHIP内存被配置为整个网络参数的存储，最后一个激活函数被修改为重新定制的Harttanh而不是Sigmoid。同样，高度的并行性应用于FPGA的逻辑资源。使用FINN Framework和Finn-HLS库将模型转换为基于HLS的应用程序，其中包括C ++中的图层定义。后来，该模型被合成和部署。 SOC的CPU采用多线程机制，负责预处理，后处理和TCP/IP流操作。因此，使用4位精确模型可实现2.4瓦总板的功耗，每秒18帧（FPS）吞吐量和0.757地图精度率。

translated by 谷歌翻译

Registering Articulated Objects With Human-in-the-loop Corrections

Michael Hagenow , Emmanuel Senft , Evan Laske , Kimberly Hambuchen , Terrence Fong , Robert Radwin , Michael Gleicher , Bilge Mutlu , Michael Zinn

分类：机器人

2022-03-11

远程编程机器人执行任务通常依赖于在机器人环境中注册感兴趣的对象。这些任务通常涉及阐明物体，例如打开或关闭阀门。但是，现有的注册对象的人类在循环方法中不考虑发音和对象几何形状的相应影响，这可能导致方法失败。在这项工作中，我们提出了一种方法，其中注册系统尝试使用非线性拟合和迭代性最接近点算法来自动确定用户选择点的对象模型，姿势和表达。当拟合不正确时，操作员可以迭代干预校正，然后系统将重新装置对象。我们介绍了具有反击关节的一种自由度（DOF）对象的拟合程序的实施，并通过用户研究对其进行评估，该用户研究表明，它可以改善用户的性能，在任务和任务负载的时间范围内，易于与手动注册方法相比，使用和有用性。我们还提出了一个示例，该示例将我们的方法集成到一个端到端系统中，以阐明远程阀。

translated by 谷歌翻译

Online AutoML: An adaptive AutoML framework for online learning

Bilge Celik , Prabhant Singh , Joaquin Vanschoren

分类：机器学习 | 人工智能

2022-01-24

Automated Machine Learning (AutoML) has been used successfully in settings where the learning task is assumed to be static. In many real-world scenarios, however, the data distribution will evolve over time, and it is yet to be shown whether AutoML techniques can effectively design online pipelines in dynamic environments. This study aims to automate pipeline design for online learning while continuously adapting to data drift. For this purpose, we design an adaptive Online Automated Machine Learning (OAML) system, searching the complete pipeline configuration space of online learners, including preprocessing algorithms and ensembling techniques. This system combines the inherent adaptation capabilities of online learners with the fast automated pipeline (re)optimization capabilities of AutoML. Focusing on optimization techniques that can adapt to evolving objectives, we evaluate asynchronous genetic programming and asynchronous successive halving to optimize these pipelines continually. We experiment on real and artificial data streams with varying types of concept drift to test the performance and adaptation capabilities of the proposed system. The results confirm the utility of OAML over popular online learning algorithms and underscore the benefits of continuous pipeline redesign in the presence of data drift.

translated by 谷歌翻译

CONFIDANT: A Privacy Controller for Social Robots

Brian Tang , Dakota Sullivan , Bengisu Cagiltay , Varun Chandrasekaran , Kassem Fawaz , Bilge Mutlu

分类：机器人

2022-01-08

由于社会机器人在日常环境中越来越普遍，因此他们将参加对话并适当地管理与他们共享的信息。然而，关于机器人如何适当地辨别信息的敏感性，这几乎都知道，这对人机信任具有重大影响。作为解决此问题的一部分的第一步，我们设计了隐私控制员，知己，用于对话社会机器人，能够使用与对话中的对话中的上下文元数据（例如，情绪，关系，主题）进行模型隐私边界。之后，我们进行了两项众群用户研究。第一项研究（n = 174）重点是，是否被认为是私人/敏感或非私人/非敏感性的各种人类互动情景。我们第一次研究的调查结果用于生成关联规则。我们的第二个研究（n = 95）通过比较使用我们的隐私控制器对基线机器人的机器人来评估人机交互情景中隐私控制器的有效性和准确性，这些机器人对基线机器人没有隐私控制。我们的结果表明，没有隐私控制器的机器人在没有隐私控制器的隐私权，可信度和社会意识中占有于机器人。我们得出结论，隐私控制器在真实的人机对话中的整合可以允许更可靠的机器人。此初始隐私控制员将作为更复杂的解决方案作为基础。

translated by 谷歌翻译